Yapay zeka okyanusunda yeni bir dev! DeepSeek nedir, özellikleri nelerdir?

HABER MERKEZİ—Teknoloji dünyası son günlerde Çin merkezli yapay zeka uygulaması DeepSeek’i konuşuyor. Düşük maliyetiyle göze çarpan uygulama şimdiden ABD’li şirketlerin hakimiyetini sarstı.

İşte kısa sürede dünya çapında en çok indirilen yapay zeka uygulamasıyla ilgili tüm detaylar:

DeepSeek

DEEPSEEK NEDİR?

DeepSeek, özellikle teknik projelerde çalışan geliştiriciler ve öğrenciler için optimize edilmiş bir deneyim sunuyor. Yapay zeka uygulamasını kullananlar, yalnızca cevap almakla kalmıyor, aynı zamanda sistemin verdiği cevapların gerekçelerini de öğrenebiliyor.

Bloomberg’e göre, DeepSeek’in R1 sürümü, OpenAI’nin en yeni modelleriyle eşdeğer bir performans sergilemekte.  Ayrıca, sohbet botları geliştirmek isteyen kullanıcılar için lisans seçenekleri sunarak, teknoloji geliştirme süreçlerini kolaylaştırmayı hedefliyor.

DeepSeek-R1’in hizmet vermeye başlamasının ardından şirket, ürününün matematik ve kodlama gibi alanlarda ChatGPT üreticisi OpenAI’nin en son modelleriyle “eşit performans” gösterdiğini söyledi.

Uygulamanın en dikkat çeken özelliği verimliliği ChatGPT çalışmak için 10 bin özel bilgisayar çipine ihtiyaç duyarken DeepSeek ise aynı işi 2 bin çiple yapıyor. 

DEEPSEEK NASIL POPÜLER OLDU

DeepSeek’in açık kaynaklı modelinin 6 milyon dolardan daha az bir maliyetle geliştirildiği belirtiliyor. Bu, sadece geçen yılki giderleri 5 milyar dolar olan ChatGPT gibi rakiplerinin harcadığı paraya kıyasla oldukça az. Popülerlik kazanmasında düşük maliyetli olmasının büyük etkisi var. 

DeepSeek’te tamamen ücretsiz ve uygulama içi satın alma yokken ChatGPT ve benzeri sistemler aylık 20-200 dolar arasında ücret alıyor.

Bu özellikler o kadar etkileyici ki, yapay zekâ dünyasının önde gelen isimlerinden ScaleAI’ın patronu Alexandr Wang, DeepSeek’i “dünyayı sarsacak bir buluş” olarak tanımladı. Model o kadar popüler oldu ki, Apple’ın uygulama mağazasında bir numaraya yükseldi.

Android içinde ise 15 günde 1 milyondan fazla kez indirilen uygulama rakibi ChatGPT’yi geride bıraktı. 

DeepSeek’in başarı hikayesinde dikkat çeken bir ayrıntı da Çin hükümetinin hassas olduğu konulardaki yaklaşımı. The Guardian‘ın testlerine göre, DeepSeek bazı politik konularda cevap vermekten kaçınıyor. Örneğin Tiananmen Meydanı olayları, eski devlet başkanı Hu Jintao’nun durumu veya Şemsiye Devrimi gibi konularda “Bu konu şu anki kapsamımın dışında, başka bir şey konuşalım” cevabını veriyor. 

İlginizi Çekebilir:  Evde şarjlı tehlike! Bunlardan uzak durun, ocağınıza ateş düşmesin

Liang Wenfeng

DEEPSEEK’İ KİM KURDU?

2021 yılı boyunca Liang Wenfeng, yapay zeka projelerinden biri için binlerce Nvidia GPU satın almaya başladı. Bu hamle, sektörde milyarder bir iş insanının yeni bir hobi edinmesi olarak görüldü. Ancak Wenfeng, oyunun kurallarını değiştirecek bir şey inşa etmek istediğini söyledi.

Wenfeng şirketi 2023’te Hangzhou kentinde şirketi kurdu.

Bilgi ve elektronik mühendisliği mezunu olan 40 yaşındaki Liang, DeepSeek’i destekleyen serbest yatırım fonunu da aynı dönemde inşa etti.

İlk olarak Kasım 2023’te yazılım geliştiriciler için DeepSeek Coder’ı çıkardı. Bu başarılı denemenin ardından ChatGPT’ye rakip olabilecek bir model geliştirmeye karar verdi. Mayıs 2024’te çıkardığı V2 modeli, düşük maliyeti ve yüksek performansıyla herkesi şaşırttı. Son olarak bu ay piyasaya sürdüğü R1 modeliyle dünya çapında bir üne kavuştu.

4- DEEPSEEK’İN TEKNOLOJİK BAŞARISI

Yapay zekada, “pekiştirmeli öğrenme” adı verilen bir sistem kullanıldı. Bu sistem sayesinde yapay zekâ, tıpkı bir çocuğun deneme yanılma yoluyla öğrenmesi gibi, kendi kendine öğrenebiliyor.

Ayrıca “uzmanlar karışımı” denilen akıllı bir sistem geliştirdiler. Bu sistem, farklı konularda uzmanlaşmış birçok küçük yapay zekâdan oluşuyor. Her soru geldiğinde, sadece o konunun uzmanları çalışmaya başlıyor. Bu da hem zamandan hem enerjiden tasarruf sağlıyor.

Üstelik “damıtma” adı verilen bir teknikle, büyük modellerin bildiklerini küçük modellere aktarabiliyor. Bu da daha az kaynakla daha çok iş yapabilmesini sağlıyor.

DeepSeek, kullanıcı verilerinin güvenliğine büyük önem veriyor.  İddialara göre sistem, verilerin yalnızca iyileştirme ve eğitim amaçlı kullanıldığını belirterek şeffaf bir politika izliyor. Gizlilik odaklı yaklaşımıyla, özellikle kurumsal müşteriler ve hassas verilerle çalışan kullanıcılar için güvenilir bir platform oluşturmayı hedefliyor.

 ABD-ÇİN REKABETİNDEKİ ROLÜ

ChatGPT ve DeepSeek gibi yapay zeka modellerinin ileriye taşınmasında gelişmiş çiplerin önemi büyük. ABD ile rekabet kıyasıya sürerken ABD Başkanı Trump’ın açıklamaları rekabeti ateşledi. 

İlginizi Çekebilir:  Mercedes-Benz'in desteklediği şirket havlu attı! Volocopter iflas başvurusunda bulundu

Donald Trump, Çin merkezli yapay zeka botu DeepSeek’in piyasaya sürdüğü son modelini olumlu karşıladığını ve bunun Amerikan endüstrisi için bir “uyandırma çağrısı” olması gerektiğini söyledi. 

Çinli şirketin daha hızlı ve çok daha uygun maliyetli bir yapay zeka modeli geliştirdiğini okuduğunu belirten Trump, “Bu iyi bir şey, çünkü o kadar fazla para harcamanıza gerek kalmıyor.” dedi.

Çinli şirketin düşük maliyetli bir yapay zeka modeli çıkarması, küresel piyasalarda teknoloji hisselerinde satış baskısına yol açtı.

ÇİP KRİZİ VE DEEPSEEK’İN STRATEJİSİ

Şirket teknolojik yeteneklerini ve pazar erişimini geliştirmek için stratejik ortaklıklar da kurdu. Dikkat çeken iş birliklerinden biri, ABD’li çip firması AMD ile yapıldı. Forbes’a göre DeepSeek, özellikle DeepSeek-V3 için model geliştirmenin temel aşamalarında AMD Instinct GPU’larını (grafik işlem birimleri) ve ROCM yazılımını kullandı.

MIT Technology Review dergisi ise ABD’den Çin’e yönelik çip yaptırımlarının gelmesinden çok önce Liang’ın, şu anda Çin’e ihracatı yasaklanmış bir tür olan Nvidia A100 çiplerinden önemli miktarda stok satın aldığını yazdı. Çinli medya kuruluşu 36Kr, şirketin stoklarında 10.000’den fazla birim olduğunu tahmin ediyor. Bazıları bu rakamın 50.000 olduğunu söylüyor. Bu stokun yapay zeka eğitimi açısından önemini fark eden Liang, DeepSeek’i kurdu ve modellerini geliştirmek için bunları düşük güçteki çiplerle birlikte kullanmaya başladı.

Ancak burada önemli olan bir nokta da Liang’ın az sayıda kaynakla yetkin modeller inşa etmenin yolunu bulmuş olması. ABD’nin çip ihracat kısıtlamaları, DeepSeek geliştiricilerini hesaplama gücü eksikliklerini telafi etmek için daha akıllı, daha enerji verimli algoritmalar oluşturmaya zorladı. ChatGPT’nin eğitim verilerini işlemek için 10.000 Nvidia GPU’ya ihtiyaç duyduğu düşünülüyor. DeepSeek mühendisleri sadece 2.000 GPU ile benzer sonuçlara ulaştıklarını söylüyor.

İlginizi Çekebilir:  Telegram yasa dışı içeriklere savaş açtı! 15 milyondan fazla grup ve kanal engellendi

DEEPSEEK’İN EKONOMİK ETKİLERİ

DeepSeek’in bu yükselişi teknoloji firmalarının hisselerini alt üst etti. 

ABD’li çip devi Nvidia’nin hisselerindeki kayıp yüzde 11’i aşarken, Nvidia’nın hisseleri yüzde 17’ye yakın kayıpla günü tamamladı. Şirketin piyasa değeri yaklaşık 600 milyar dolar düştü.

Bu düşüş, ABD tarihinde bir şirketin yaşadığı en büyük günlük değer kaybı olarak dikkati çekti. Alphabet’in hisseleri yüzde 4 ve Microsoft’un hisseleri yüzde 2 değer kaybetti. Çip şirketi Broadcom’un hisselerinde de yüzde 17,4 azalış görüldü.

Intel ve Samsung’un da bulunduğu yarı iletken firması ASML’in hisseleri neredeyse yüzde 7,5 düşerken, Siemens Energy yaklaşık yüzde 18 değer kaybetti.

GLOBAL PAZARDAKİ REKABET AVANTAJLARI

Çinli yapay zeka uygulaması DeepSeek’in global pazardaki rekabet avantajları, açık kaynaklı modelinin erişilebilirliği ve düşük maliyetli üretimiyle dikkat çekiyor.

OpenAI’ın ChatGPT’si ve diğer rakiplerine kıyasla, DeepSeek’in R1 modeli daha uygun fiyatlarla yüksek performans sunuyor. Tüm bunlar da bireysel kullanıcılar ve özellikle de  küçük işletmeler için büyük bir fırsat oluşturuyor. Ayrıca, DeepSeek’in hızlı işlem gücü de rakiplerinin daha büyük ve maliyetli modellerine karşı önemli bir rekabet avantajı sağlıyor.

DEEPSEEK’İN GELECEĞİ VE STRATEJİK PLANLARI

DeepSeek, inovasyon, maliyet avantajı ve açık kaynak stratejileriyle yapay zeka dünyasında dikkat çeken bir güç olarak öne çıkıyor. Şirketin yüksek performanslı modelleri, piyasa dinamiklerini yeniden şekillendirirken, Liang Wenfeng’in liderliğinde sürdürülebilir büyüme ve küresel genişleme hedefleriyle yapay zeka ekosisteminin geleceğini şekillendirme potansiyeline sahip. Ancak bu başarıyı sürdürmek için teknolojiye ek olarak stratejik iş birlikleri ve küresel zorluklara karşı proaktif yaklaşımlar da kritik öneme sahip olacak.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir